بررسی اثرات خطوط تلفنی بر روی سیگنال صوتی و جبران اثرات نویز تلفنی بر سیستم بازشناسی گفتار فارسی

thesis
  • وزارت علوم، تحقیقات و فناوری - دانشگاه علم و صنعت ایران - دانشکده مهندسی کامپیوتر
  • author سعید مرادی
  • adviser احمد اکبری
  • Number of pages: First 15 pages
  • publication year 1382
abstract

شرایط محیطی دریافت صوت از جمله محدودیت پهنای باند در کانال انتقال استفاده از وسایل با کیفیت پایین و اثر میکروفن بعنوان نویز کانوالو شونده و همچنین اثرات جریان هوا و گفتگوهای زمینه و .... بعنوان نویز جمع شونده باعث افت آشکار در کارایی سیستم های بازشناسی گفتار می شود. هدف از روشهای مقاوم سازی در برابر نویز کم کردن عدم تطابق بین توزیع بردارهای ویژگی در تشخیص دهنده و داده ا آزمون و بالابردن کارایی سیستم بازشناسی گفتار است. روشهای مقاوم سازی را می توان در قالب دو گروه مبتنی بر داده و مبتنی بر مدل تقسیم کرد. روشهای مبتنی بر داده سیگنال گفتار یا ویژگیهای آن را اصلاح می کند و روشهای مبتنی بر مدل بدون تغییر در سیگنال یا ویژگیهای آن پارامترهای مدل را تغییر داده و اصلاح می کنند. در این پایان نامه روشهای مقاوم سازی مبتنی بر داده مورد نظر بوده و از آن میان روش تفاضل طیف و تبدیل موجک برای بهبود نویز پس زمینه سیگنال و روش تفاضل میانگین کپسترال برای جبران اثر نویز کانال مورد استفاده قرار گرفته اند. که چهار نوع الگوریتم مختلف حذف نویز در تبدیل موجک استفاده گردیده است. برای آزمایش این روشها در مورد بازشناسی در این پروژه یک پایگاه داده اختصاصی گفتار شامل اعداد یک رقمی فارسی با یکصد گوینده مختلف بصورت تلفنی و موبایل پیاده سازی و ایجاد شده است. در این پروژه با توجه یه اینکه استفاده معمولی از الگوریتم های حذف بروش تبدیل موجک بهبودی در کاربردهای بازشناسی بدست نمی دهد یک راه حل جدید برای افزایش کارایی این الگوریتم ها ارایه گردیده است. آزمایشات انجام یافته برای گوینده هایی که در آموزش شرکت داشته اند و گوینده هایی که در آموزش شرکت نداشته اند در سیگنال به نویزهای مختلف بطور جداگانه انجام گرفته و در مقایسه با روش پایه mfcc برای بازشناسی با ویژگیهای مقاوم 2 تا 6 درصد و با روش تفاضل طیف 4 الی 14 درصد بهبود مشاهده می شود. در الگوریتم های حذف نویز بروش تبدیل موجک الگوریتم rigrsure نسبت به سه الگوریتم دیگر بهتر عمل کرده ولی نسبت به روشهای قبلی بهبودی نشان نمی دهند. که یک راه حل جدید برای افزایش کارایی الگوریتم های مختلف این روش ارایه گردیده است.

First 15 pages

Signup for downloading 15 first pages

Already have an account?login

similar resources

بازشناسی مقاوم گفتار تلفنی فارسی مبتنی بر روش سری های تیلور برداری

برای مقاوم سازی سیستم بازشناسی گفتار در برابر عوامل مزاحم محیطی (نویز جمع شونده، اثر اعوجاج کانال انتقال و نویزهای گذرا) سه ایده کلی وجود دارد: 1- استخراج وی‍ژگی های مقاوم(robust feature extraction) 2- بهبود کیفیت بردارهای بازنمایی (feature enhancement) 3- اصلاح مدل بازشناسی صوتی (acoustic model compensation) در ایده اول سعی می شود تا از ویژگی ها و پارمترهایی از سیگنال گفتار برای ساخت بر...

15 صفحه اول

ارتقاء کیفیت بازشناسی گفتار تلفنی و غیر تلفنی با استفاده از اشتراک دانش آوایی دادگان

سیستمهای بازشناسی مقاوم گفتار به سیستمهایی اطلاق می گردد که در شرایط عدم انطباق داده های آموزش و آزمون صحت بازشناسی قابل قبولی داشته باشند. در تحقیق حاضر یک سیستم بازشناسی مقاوم گفتار تلفنی، مبتنی بر اصلاح بردارهای بازنمایی توسط شبکه عصبی دوسویه (یک شبکه عصبی چند لایه معمولی به علاوه یک شاخه برگشتی که اطلاعات لایه مخفی شبکه را با ورودی شبکه ترکیب می کند) و مدلهای مخفی مارکف به عنوان مدلهای بازش...

15 صفحه اول

مقایسه تأثیر وضعیت طاق باز و دمر بر وضعیت تنفسی نوزادان نارس مبتلا به سندرم دیسترس تنفسی حاد تحت درمان با پروتکل Insure

کچ ی هد پ ی ش مز ی هن ه و فد : ساسا د مردنس رد نامرد ي سفنت سرتس ي ظنت نادازون داح ي سکا لدابت م ي و نژ د ي سکا ي د هدوب نبرک تسا طسوت هک کبس اـه ي ناـمرد ي فلتخم ي هلمجزا لکتورپ INSURE ماجنا م ي دوش ا اذل . ي هعلاطم ن فدهاب اقم ي هس عضو ي ت اه ي ندب ي عضو رب رمد و زاب قاط ي سفنت ت ي هـب لاتـبم سراـن نادازون ردنس د م ي سفنت سرتس ي لکتورپ اب نامرد تحت داح INSURE ماجنا درگ ...

full text

بازشناسی گوینده مستقل از متن براساس گفتار تلفنی توسط شبکه های عصبی

در این پایان نامه سیستمی به منظور بازشناسی هویت گوینده مستقل از متن براساس گفتار تلفنی و به کمک شبکه های عصبی طراحی و پیاده سازی شده است . جهت این کار از دو دادگان گفتار زبان فارسی farsdat و tfarsdat استفاده شده است .

15 صفحه اول

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


document type: thesis

وزارت علوم، تحقیقات و فناوری - دانشگاه علم و صنعت ایران - دانشکده مهندسی کامپیوتر

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023